1. Informações, Pacotes R e datasets


##    rmarkdown        knitr    multimode      modeest      rstatix     univOutl 
##         TRUE         TRUE         TRUE         TRUE         TRUE         TRUE 
##       readxl         utf8          pwr     forecast MultNonParam      ggplot2 
##         TRUE         TRUE         TRUE         TRUE         TRUE         TRUE 
##        earth       plotly           DT   kableExtra        dplyr        stats 
##         TRUE         TRUE         TRUE         TRUE         TRUE         TRUE 
##    segmented        caret      refineR     SciViews   rcompanion   effectsize 
##         TRUE         TRUE         TRUE         TRUE         TRUE         TRUE 
##          car      moments       ggpubr 
##         TRUE         TRUE         TRUE


2. Estatística descritiva

Tabela 3. Medidas de Posição - Resultados individuais.
Estatísticas Prolactina LDL-c
Tamanho amostral 65795.000 65795.000
Mínimo 0.300 4.000
Moda 10.306 108.973
Média 11.902 113.661
Mediana 9.100 111.000
Máximo 297.500 452.000
Tabela 4. Medidas de Dispersão - Resultados individuais.
Estatísticas Prolactina LDL-c
Tamanho amostral 65795.000 65795.000
Desvio-Padrão (DP) 11.499 32.529
Variância 132.222 1058.126
Intervalo Interquartil (IIQ) 6.900 42.000
Amplitude (Range) 297.200 448.000
Tabela 5. Medidas de Posição - resultados médios.
Estatísticas Prolactina LDL-c
Tamanho amostral 106.000 106.000
Mínimo 2.312 104.534
Moda 15.858 109.064
Média 25.954 111.775
Mediana 15.671 110.810
Máximo 222.475 126.480
Tabela 6. Medidas de Dispersão - resultados médios.
Estatísticas Prolactina LDL-c
Tamanho amostral 106.000 106.000
Desvio-Padrão (DP) 34.708 4.584
Variância 1204.654 21.016
Intervalo Interquartil (IIQ) 16.719 6.796
Amplitude (Range) 220.163 21.946


3. Verificando presupostos

Tabela 7. Resultado do Teste de Homogeneidade das Variâncias (Levene) - resultados individuais:
GL Valor F p-valor
group 3 47.0656 0
65791 NA NA
Interpretação
Os grupos não apresentam variâncias homogêneas (p = 0 <= alfa: 0.005).
Tabela 8. Distribuição dos resultados individuais de Prolactina (n = 65795 ).
Parâmetros estatísticos Resultados
Coeficiente de curtose 107.95
Interpretação do coeficiente de curtose A distribuição pode ser considerada leptocúrtica.
Coeficiente de assimetria 7.73
Interpretando o resultado do coeficiente de assimetria Essa distribuição é muito assimétrica para a direita.
Nota:
Se a curtose estiver entre 2,7 e 3,3, a distribuição pode ser considerada mesocúrtica.
Se a curtose for menor que 2,7, a distribuição é Platicúrtica.
Se a curtose for maior que 3,3, a distribuição é Leptocúrtica.
Se a assimetria for menor que -1 ou maior que 1, a distribuição é altamente assimétrica.
Se a assimetria estiver entre -1 e -0,5 ou entre 0,5 e 1, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,5 e -0,15 ou entre 0,15 e 0,5, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,15 e 0,15, a distribuição é aproximadamente simétrica.
Tabela 9. Distribuição de resultados individuais de LDL-c (n = 65795 ).
Parâmetros estatísticos Resultados
Coeficiente de curtose 4.94
Interpretação do coeficiente de curtose A distribuição pode ser considerada leptocúrtica.
Coeficiente de assimetria 0.75
Interpretando o resultado do coeficiente de assimetria A relação empírica entre Média, Mediana e Moda é: Média > Mediana > Moda. Esta distribuição é assimétrica para a direita.
Nota:
Se a curtose estiver entre 2,7 e 3,3, a distribuição pode ser considerada mesocúrtica.
Se a curtose for menor que 2,7, a distribuição é Platicúrtica.
Se a curtose for maior que 3,3, a distribuição é Leptocúrtica.
Se a assimetria for menor que -1 ou maior que 1, a distribuição é altamente assimétrica.
Se a assimetria estiver entre -1 e -0,5 ou entre 0,5 e 1, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,5 e -0,15 ou entre 0,15 e 0,5, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,15 e 0,15, a distribuição é aproximadamente simétrica.
Tabela 10. Resultado do Teste de Homogeneidade das Variâncias (Levene) - resultados médios:
GL Valor F p-valor
group 3 2.299302 0.0818439
102 NA NA
Interpretação
Os grupos apresentam variâncias homogêneas (p = 0.0818 > 0.005).
Tabela 11. Distribuição dos resultados médios de Prolactina (n = 106 ).
Parâmetros estatísticos Resultados
Coeficiente de curtose 16.27
Interpretação do coeficiente de curtose A distribuição pode ser considerada leptocúrtica.
Coeficiente de assimetria 3.47
Interpretando o resultado do coeficiente de assimetria Essa distribuição é muito assimétrica para a direita.
Nota:
Se a curtose estiver entre 2,7 e 3,3, a distribuição pode ser considerada mesocúrtica.
Se a curtose for menor que 2,7, a distribuição é Platicúrtica.
Se a curtose for maior que 3,3, a distribuição é Leptocúrtica.
Se a assimetria for menor que -1 ou maior que 1, a distribuição é altamente assimétrica.
Se a assimetria estiver entre -1 e -0,5 ou entre 0,5 e 1, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,5 e -0,15 ou entre 0,15 e 0,5, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,15 e 0,15, a distribuição é aproximadamente simétrica.
Tabela 12. Distribuição de resultados médios de LDL-c (n = 106 ).
Parâmetros estatísticos Resultados
Coeficiente de curtose 2.88
Interpretação do coeficiente de curtose A distribuição pode ser considerada mesocúrtica.
Coeficiente de assimetria 0.63
Interpretando o resultado do coeficiente de assimetria A relação empírica entre Média, Mediana e Moda é: Média > Mediana > Moda. Esta distribuição é assimétrica para a direita.
Nota:
Se a curtose estiver entre 2,7 e 3,3, a distribuição pode ser considerada mesocúrtica.
Se a curtose for menor que 2,7, a distribuição é Platicúrtica.
Se a curtose for maior que 3,3, a distribuição é Leptocúrtica.
Se a assimetria for menor que -1 ou maior que 1, a distribuição é altamente assimétrica.
Se a assimetria estiver entre -1 e -0,5 ou entre 0,5 e 1, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,5 e -0,15 ou entre 0,15 e 0,5, a distribuição é moderadamente assimétrica.
Se a assimetria estiver entre -0,15 e 0,15, a distribuição é aproximadamente simétrica.

4. Critérios clínicos baseado na VB e estado da arte


Tabela 13. Bias permitido baseado nos componentes da variação biológica - Modelo 2 da Conferência de Milão.
Estatística Resultados
Coeficiente Variação Individual (CVi) 8.3
Coeficiente Variação Grupo (CVg) 26.6
Critério da Variação biológica desejável
Bias percentual permitido 6.966
Limite de decisão médica 110
Bias absoluto permitido 7.663
Tabela 14. Bias permitido baseado no estado da arte - Modelo 3 da Conferência de Milão.
Estatística Resultados
Limite Superior do IR 183.24400
Limite Inferior do IR 62.00900
CV empírico (CVe) 0.28178
CV analítico permitido (pCVa) 0.05285
Slope 0.04228
Mediana do Intervalo de Referência (Med) 106.59633
Desvio padrão analítico permitido para um valor na mediana (pSA_Med) 5.63327
Limite de decisão médica (xi) 110.00000
pSA_xi 5.77717
Bias % permitido no nível de decisão médica (pB_xi) 3.67638
Bias permitido no nível de decisão médica (pB_xi) 4.04400
Tabela 15. Critério clínico selecionado.
Bias Permitido Selecionado
7.6626
Fonte:
Modelo 2 da Conferência de Milão - Bias permitido nos componentes da variação biológica


5. Comparação entre faixas (Resultados individuais)


Tabela 16. Resultados individuais por faixa de concentração - resultados individuais.
Faixa de resultados PRL n Percentil 25 LDL-c Mediana LDL-c Percentil 75 LDL-c Percentil 25 Prolactina Mediana Prolactina Percentil 75 Prolactina
PRL<7 18939 95 115 139 4.6 5.5 6.3
7<=PRL<25 42644 90 109 131 8.5 10.6 14.2
25<=PRL<100 4035 87 105 126 27.8 32.1 40.6
PRL>100 177 94 114 136 118.2 141.7 175.6
Tabela 17. Teste de Kruskal-Wallis (Critério A - Avaliando a significância estatística) - resultados individuais.
Estatísticas Resultados
Kruskal-Wallis chi-squared 580.459
df 3
p-value < 0.00005
Tabela 18. Teste Post hoc de Dunn (Critério A - Avaliando a significância estatística, alfa = 0.005) - resultados individuais.
Grupo 1 Grupo 2 n1 n2 p-valor ajustado Interpretação
25<=PRL<100 7<=PRL<25 4035 42644 0.00000 Diferente
25<=PRL<100 PRL<7 4035 18939 0.00000 Diferente
25<=PRL<100 PRL>100 4035 177 0.00240 Diferente
7<=PRL<25 PRL<7 42644 18939 0.00000 Diferente
7<=PRL<25 PRL>100 42644 177 0.32768 Igual
PRL<7 PRL>100 18939 177 1.00000 Igual
Tabela 19. Tamanho de efeito (TDE) do Grupo (Critério B.1 - Avaliando a significância prática).
Método TDE Limite Inferior IC 95% Limite Superior IC 95% Interpretação
epsilon2 ordinal 0.00882 0.00748 0.0104 irrisório
Tabela 20. Tamanho de efeito Linguagem Comum (TDE-LC) pelo método Vargha-Delaney A (Critério B.1 - Avaliando a significância prática) - resultados individuais.
Comparação TDE-LC TDE-LC máximo Interpretação
25<=PRL<100 - 7<=PRL<25 0.463 0.537 irrisório
25<=PRL<100 - PRL<7 0.411 0.589 Pequeno
25<=PRL<100 - PRL>100 0.422 0.578 Pequeno
7<=PRL<25 - PRL<7 0.446 0.554 irrisório
7<=PRL<25 - PRL>100 0.458 0.542 irrisório
PRL<7 - PRL>100 0.512 0.512 irrisório
Tabela 21. Comparação resultado entre faixas Prolactina (Critério B.2 - Avaliando significância clínica) - resultados individuais.
Diferença entre Faixas Diferença entre médias em módulo Média das diferenças Bias absoluto permitido Interpretação
‘PRL<7’ - ‘7<=PRL<25’ |118.165 - 112.165| 6.000 7.6626 Igual
‘PRL<7’ - ‘25<=PRL<100’ |118.165 - 108.204| 9.961 7.6626 Diferente
‘PRL<7’ - ‘PRL>100’ |118.165 - 116.52| 1.645 7.6626 Igual
‘7<=PRL<25’ - ‘25<=PRL<100’ |112.165 - 108.204| 3.961 7.6626 Igual
‘7<=PRL<25’ - ‘PRL>100’ |112.165 - 116.52| 4.355 7.6626 Igual
‘25<=PRL<100’ - ‘PRL>100’ |108.204 - 116.52| 8.316 7.6626 Diferente


6. Comparação entre faixas (Resultados médios)


Tabela 22. Resultados individuais por faixa de concentração - resultados médios.
Faixa de resultados PRL n Percentil 25 LDL-c Mediana LDL-c Percentil 75 LDL-c Percentil 25 Prolactina Mediana Prolactina Percentil 75 Prolactina
PRL<7 17 117.3720 118.067 119.6530 4.04900 4.8030 5.80300
7<=PRL<25 60 108.4327 110.509 112.9753 10.73375 14.4525 18.16125
25<=PRL<100 23 106.6635 108.009 110.6585 27.94900 32.9690 43.91800
PRL>100 6 113.9458 114.933 118.6773 118.30875 139.0020 168.58200
Tabela 23. Teste de Kruskal-Wallis (Critério A - Avaliando a significância estatística) - resultados médios.
Estatísticas Resultados
Kruskal-Wallis chi-squared 51.703
df 3
p-value < 0.00005
Tabela 24. Teste Post hoc de Dunn (Critério A - Avaliando a significância estatística, alfa = 0.005) - resultados médios.
Grupo 1 Grupo 2 n1 n2 p-valor ajustado Interpretação
25<=PRL<100 7<=PRL<25 23 60 0.35055 Igual
25<=PRL<100 PRL<7 23 17 0.00000 Diferente
25<=PRL<100 PRL>100 23 6 0.00135 Diferente
7<=PRL<25 PRL<7 60 17 0.00000 Diferente
7<=PRL<25 PRL>100 60 6 0.02500 Igual
PRL<7 PRL>100 17 6 1.00000 Igual
Tabela 25. Tamanho de efeito (TDE) do Grupo (Critério B.1 - Avaliando a significância prática) - resultados médios.
Método TDE Limite Inferior IC 95% Limite Superior IC 95% Interpretação
epsilon2 ordinal 0.492 0.349 0.63 Grande
Tabela 26. Tamanho de efeito Linguagem Comum (TDE-LC) pelo método Vargha-Delaney A (Critério B.1 - Avaliando a significância prática) - resultados médios.
Comparação TDE-LC TDE-LC máximo Interpretação
25<=PRL<100 - 7<=PRL<25 0.32700 0.67300 Moderado
25<=PRL<100 - PRL<7 0.02560 0.97440 Grande
25<=PRL<100 - PRL>100 0.05070 0.94930 Grande
7<=PRL<25 - PRL<7 0.00196 0.99804 Grande
7<=PRL<25 - PRL>100 0.10000 0.90000 Grande
PRL<7 - PRL>100 0.70600 0.70600 Moderado
Tabela 27. Comparação resultado entre faixas Prolactina (Critério B.2 - Avaliando significância clínica) - resultados médios.
Diferença entre Faixas Diferença entre médias em módulo Média das diferenças Bias absoluto permitido Interpretação
‘PRL<7’ - ‘7<=PRL<25’ |118.602 - 110.482| 8.120 7.6626 Diferente
‘PRL<7’ - ‘25<=PRL<100’ |118.602 - 108.745| 9.857 7.6626 Diferente
‘PRL<7’ - ‘PRL>100’ |118.602 - 116.976| 1.626 7.6626 Igual
‘7<=PRL<25’ - ‘25<=PRL<100’ |110.482 - 108.745| 1.737 7.6626 Igual
‘7<=PRL<25’ - ‘PRL>100’ |110.482 - 116.976| 6.494 7.6626 Igual
‘25<=PRL<100’ - ‘PRL>100’ |108.745 - 116.976| 8.231 7.6626 Diferente


7. Regressão Segmentada e “Ponto Inflexão”


Tabela 28. Equação regressão e Ponto de Inflexão.
Resultados da Regressão segmentada
Ponto de inflexão: 16.61; IC 95%: 14.49 a 18.73
Eq Reg. linear <= à Broken-line: LDL-c = 122.4522 + -0.8769 x Prolactina (r = -0.93; R2 = 0.86)
Eq Reg. linear > do que a Broken-line: LDL-c = 106.7039 + 0.0594 x Prolactina (r = 0.63; R2 = 0.4)
Nota de rodapé:
O ‘Ponto de Inflexão’ usada para segmentação dos dados foi o limmite inferior do Intervalo de Confinaça de 95% do ‘Break-point’.
Tabela 29. Comparando o desempenho nos dados de treino e teste - Verificando a capacidade de generalização do modelo de Regressão Segmentada.
Métricas Desempenho dados treino Desempenho dados teste
Raiz Quadrática Média dos Erros (RMSE) 1.25 1.56
Coeficiente de Determinação (Rsquared) 0.88 0.88
Erro Médio Absoluto (MAE) 0.88 1.34
Capacidade de Generalização baseada na Regressão Segmentada:
Capacidade Preditiva utilizando o modelo de regressão segmentada e utilizando todo o dataset.


8. Splines de Regressão Adaptativa Multivariada


Tabela 30. Comparando o desempenho nos dados de treino e teste (Verificando a capacidade de generalização).
Métricas Desempenho dados treino Desempenho dados teste
Raiz Quadrática Média dos Erros (RMSE) 1.14 1.53
Coeficiente de Determinação (Rsquared) 0.90 0.90
Erro Médio Absoluto (MAE) 0.82 1.30
Capacidade de Generalização baseada na Splines de Regressão Adaptativa Multivariada (MARS):
Capacidade Preditiva utilizando o modelo MARS e utilizando apenas o subset com maior linearidade.


9. Previsoes e Desempenho


Tabela 31. Comparando o desempenho nos dados de treino e teste (Verificando a capacidade de generalização).
Modelos usados para Previsão Previsão resultados de LDL-c Métricas avaliação (Capacidade Generalização)
Regressão Segmentada LDL-c ( mg/dL ) >= 109.59 (IC95%: 108.24 a 110.93 ) RMSE: 1.56; R2: 0.88; MAE:1.34
Splines de Regressão Adaptativa Multivariada LDL-c ( mg/dL ) >= 110.07 RMSE: 1.53; R2: 0.9; MAE:1.3
Capacidade de Generalização baseada na Splines de Regressão Adaptativa Multivariada (MARS):
Capacidade Preditiva utilizando o modelo MARS e utilizando apenas o subset com maior linearidade.
Capacidade de Generalização baseada na Regressão Segmentada:
Capacidade Preditiva utilizando o modelo de regressão segmentada e utilizando todo o dataset.